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摘 Æ: CCD (Charge Coupled Device) 图 像 中 的 宇宙 线 是 来 自 于 外 太空 的 高 能 粒子 ， 
它 穿 过 大 气 层 ， 与 大 气 层 的 粒子 发 生 相 互 作用 形成 次 级 粕 子 ， 最 后 落 在 CCD 上 。h 子 是 大 气 
层 宇 宙 线 的 主要 成 分 ， 为 了 研究 这 些 h 子 的 性 质 和 变化 规律 ， 首 先 需要 对 图 像 中 的 h 子 进行 
甄选 。 本 文 介 绍 一 种 快速 有 效 地 从 CCD 图 像 中 甄选 nb 子 的 方法 。 采 用 拉 普 拉 斯 边缘 检测 法 从 
CCD 图 像 中 提取 宇宙 线 候选 像素 列表 ， 去 除 其 中 的 坏 像素 和 嗓 声 ， 然 后 使 用 凝聚 层次 聚 类 
算法 将 宇宙 线 像 素 聚 类 成 宇宙 线 事件 ,对 宇宙 线 事件 进行 特征 提取 和 分 类 ,从 中 甄选 宇宙 线 
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宇宙 线 是 来 自 于 外 太空 的 高 能 粒子 。1912 年 ， 由 奥地利 地 理学 家 赫 斯 在 电离 室 对 电流 的 
测量 中 第 一 次 发 现 。 宇 宙 线 中 质子 和 氨 核 占 98%， 重 核 %， 电 子 %， 其 他 粒子 微量 ”"。 当 初 
级 宇宙 线 进 入 地 球 大 气 层 时 , 质子 和 氨 核 等 高 能 粒子 与 大 气 中 的 原子 核 相互 作用 产生 级 联 的 
广 延 大 气 秘 射 ， 生 成 大 量 的 次 级 粒子 。 在 使 用 CCD 观 测 目 标 源 时 ， 这 些 粒 子 在 CCD 上 留 下 
不 同 的 径 迹 ， 其 中 有 电子 、a 粒 子 、X 射 线 以 及 ph 子 等 粒子 。 靠 近 大 气 底部 的 宇宙 线 主 要 是 簇 
射 产生 的 次 级 4 子 。 在 CCD 图 像 的 宇宙 线 中 ， 占 据 主 要 成 分 的 是 pn 子 。k 子 和 电子 等 带电 粒 
子 ， 在 CCD 上 留 下 明显 的 特征 径 迹 。 电 子 大 部 分 是 由 于 环境 中 放射 性 同位 素 所 产生 的 ， 并 
非 来 源 于 宇宙 线 (在 参考 文献 [2] 有 详细 介绍 ) 。o 粒 子 和 X 射 线 等 其 他 粒子 在 CCD 图 像 中 图 
像 特 征 呈 点 状 ， 不 易 与 CCD 芯 片 本 身 产生 的 电子 学 噪声 分 开 。 因 此 研究 CCD 图 像 中 的 宇宙 
线 ， 需 要 对 宇宙 线 中 的 hn 子 进行 甄选 。 

现 如 今 ， 探 测 宇宙 线 的 装置 有 很 多 ， 例 如 西藏 羊 八 井 国际 宇宙 线 观 测 站 、 印 度 乌 带 的 
GRAPES-3、 阿 根 廷 的 Pierre Auger Observatory 以 及 四 川 的 LHAASO “高 海拔 宇宙 线 观 测 站 ) 
等 。 这些 装 置 采 用 一 系列 探测 器 阵列 和 望远镜 来 探测 宇宙 线 粒 子 。 本 文 利 用 LAMOST 的 CCD 
图 像 来 探测 u 子 .LAMOST(The Large Sky Area Multi-Object Fiber Spectroscopic Telescope) 是 
中 国 目 前 最 大 口径 的 望远镜 。 参 考 文献 [3] 系 统 性 地 介绍 了 LAMOST 的 结构 、 原 理 及 应 用 。 
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LAMOST 配 置 有 16 个 光谱 仪 和 32 台 4kx4k 的 CCD 相 机 .CCD 芯 片 大 小 为 49.2mmx49.2mm， 
像素 大 小 为 12hmX 12hm， 工 作 温 度 在 -100C 左 右 。 从 2011 年 先导 巡天 至 今 ， 已 经 积累 了 
一 百 万 多 张 CCD 原 始 图 像 ， 每 幅 图 像 都 有 很 多 宇宙 线 事件 ， 可 以 用 来 研究 宇宙 线 的 性 质 和 
分 布 。CCD 图 像 中 的 宇宙 线 个 数 与 图 像 的 曝光 时 间 有 关 ， 将 曝光 时 间 归 一 化 到 分 钟 。 在 单 
位 时 间 内 ，CCD 图 像 中 的 宇宙 线 事 件 个 数 范围 为 5~60。 

CCD 的 工作 原理 是 利用 光电 效应 将 光子 转化 为 电子 ， 电 容器 吸收 释放 的 电子 ， 然 后 将 
收集 的 电子 转化 为 电压 ， 最 后 以 数字 信和 号 的 形式 输出 。k 子 有 带 负 电 和 带 正 电 两 种 ， 电 荷 数 
为 1。 它 的 质量 约 为 106MeV， 比 电子 重 207 倍 。 当 它 穿 过 CCD 时 ， 可 以 电离 径 迹 上 的 硅 原 
子 ， 受 到 库伦 散射 和 征 致 辐射 的 影响 比 电子 小 ， 在 CCD 上 留 下 可 识别 的 直线 径 迹 。 

参考 文献 2] 介绍 CCD 图 像 中 的 宇宙 线 事 件 〈 指 在 CCD 图 像 中 一 组 有 计数 的 连续 像素 ) 
关于 质心 呈现 不 同 的 分 布 ， 结 合 宇宙 线 事件 的 形态 特征 甄选 w 子 。 本 文 基于 LAMOST 数 据 ， 
对 CCD 图 像 进 行 分 析 处 理 。 根 据 n 子 在 CCD 图 像 中 的 形态 特征 对 其 进行 甄选 。 首 先 从 CCD 图 
像 中 提取 宇宙 线 像 素 ， 文 中 采用 拉 普 拉 斯 边缘 检测 法 从 CCD 原 始 图 像 中 提取 宇宙 线 候选 像 
素 列表 。 在 提取 后 的 宇宙 线 候 选 像素 列表 中 包含 一 些 坏 像素 和 噪点 ， 需 要 对 这 些 坏 像素 和 噪 
点 进行 处 理 。 数 据 处 理 过 程 中 ， 为 了 得 到 独立 完整 的 宇宙 线 事 件 ， 采 用 凝聚 层次 聚 类 算法 将 
宇宙 线 像素 聚 类 成 宇宙 线 事件 。 提 取 宇 宙 线 事件 的 特征 ， 结 合 nb 子 在 CCD 图 像 中 的 形态 特征 
甄选 出 宇宙 线 hb 子 。 在 文中 最 后 对 甄选 技术 进行 评估 。 


m 
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1 拉 普 拉 斯 边缘 检测 法 提取 宇宙 线 候选 像素 列表 


在 LAMOST 数 据 中 ， 单 次 曝光 的 CCD 图 像 中 含有 上 百 条 流量 值 很 强 的 光纤 光谱 。 这 些 
CCD 图 像 中 ， 不 仅 包含 所 要 观测 的 目标 信息 ， 同 时 还 包括 一 些 噪声 〈 主 要 是 宇宙 线 和 坏 像 
R) 。 在 对 CCD 图 像 中 的 un 子 进行 昧 选 时 ， 首 先 要 从 CCD 图 像 中 获取 宇宙 线 候 选 像素 列表 。 
检测 CCD 图 像 宇宙 线 的 方法 有 很 多 ， 例 如 经 典 的 中 值 滤波 方法 外 ， 拉 普 拉 斯 边缘 检测 法 中 ， 
基于 直方 图 的 快速 算法 以 及 万 能 噪声 消除 算法 中 等 方法 。 本 文采 用 改进 的 拉 普 拉 斯 边缘 检 
则 法 外 对 CCD 图 像 中 的 宇宙 线 候选 像素 列表 进行 提取 。 相 较 于 其 他 方法 ， 该 方法 在 图 像 背 景 
流量 值 很 强 的 情况 下 ,可 以 有 效 地 从 单 次 曝光 的 多 光纤 光谱 中 检测 宇宙 线 。 它 是 在 参考 文献 
[5 介绍 的 算法 上 进行 改进 , 使 得 当 宇 宙 线 落 在 光纤 光谱 轮廓 内 时 , 宇宙 线 可 以 被 识别 出 来 。 

改进 的 拉 普 拉 斯 边缘 检测 法 的 算法 流程 : 

(1) 对 原 图 像 进 行 预 处 理 ， 然 后 与 尺寸 大 小 为 3X3 的 Laplacian 模 板 进行 卷 积 运算 得 
到 图 像 1; 结合 泊 松 噪声 和 读 出 噪声 , 在原 图 像 基础 上 构造 剔除 宇宙 线 的 噪声 模型 N;， 再 根据 
7 和 NX 的 比率 关系 ， 生 成 一 个 原始 的 宇宙 线 候 选 像素 列表 ; 

(2) 在 原 图 像 的 基础 上 去 除 步 骤 (1) 产 生 的 宇宙 线 候选 像素 列表 , 生成 一 个 新 的 图 像 。 
对 图 像 中 的 每 一 条 光纤 进行 处 理 ， 将 距离 光纤 轨迹 中 心 8 个 像素 以 内 的 像素 点 组 成 一 个 模 


块 。 结 合 光谱 在 空间 方向 和 色散 方向 的 分 布 情况 , 拟 合 这 些 模块 的 图 像 轮廓 〈 这 些 拟 合 的 图 
像 轮 廊 不 包括 宇宙 线 ) ， 得 到 拟 合 后 的 图 像 六 

C3) 根据 泊 松 噪声 和 读 出 噪声 ， 对 拟 合 后 的 图 像 习 构造 剔除 宇宙 线 的 噪声 模型 Wi;， 最 
后 将 原 图 像 和 拟 合 后 图 像 的 残 差 与 噪声 模型 V) 进行 比较 生成 宇宙 线 候选 像素 列表 。 

采用 拉 普 拉 斯 边缘 检测 法 提取 宇宙 线 候选 像素 列表 的 结果 见 图 1。 图 1 (a) 是 原始 图 像 ， 
是 从 CCD 图 像 中 截取 的 一 部 分 图 像 ， 图 1 (b) 对 应 于 图 1 (a) 采用 拉 普 拉 斯 边缘 检测 法 提取 后 
的 宇宙 线 像素 ， 图 中 的 背景 为 黑色 ,对 应 的 流量 值 为 0。 从 图 1 可 以 直观 地 显示 出 该 算法 可 
以 有 效 地 从 CCD 图 像 中 提取 宇宙 线 像 素 。 


(a) 原始 图 像 (290x278) 


(b) 拉 普 拉 其 


图 1 拉 普 拉 斯 边缘 检测 法 提取 宇宙 线 


边缘 检测 法 提取 的 宇宙 线 图 像 (290x278) 


Fig.1 Extraction of cosmic rays with Laplacian edge detection algorithm 


2 坏 像素 和 了 噪点 的 处 理 


在 采用 拉 普 拉 斯 边 
以 及 算法 导致 的 噪点 。CCD 上 的 坏 像素 是 CCD 本 身 的 坏 点 
像 中 的 同一 位 置 处 出 现 。 
素 , 然后 将 它们 去 除 。 在 使 
轨迹 中 心 发 


坏 像 素 ， 
的 CCD 医 


的 光纤 


力 缘 检 测 法 提取 的 宇宙 线 候选 像素 列表 中 


， 包 括 了 宇宙 线 ，CCD 上 的 


可 以 利用 同 


j 拉 普 拉 斯 边 


le 


E 目标 的 多 次 曝光 
力 缘 检测 法 提取 宇宙 线 候选 像素 列表 时 ， 如 果 图 


ba 


生 偏 


移 时 ， 


KE 


图 像 中 找 出 


的 基础 上 产生 拟 合 的 偏 


差 ,这 些 偏 


ij 差 就 是 算法 导致 的 噪点 这些 噪点 在 图 
线 处 的 像素 点 个 数 远 超 过 宇宙 线 在 图 像 中 每 一 列 可 能 的 像素 点 个 数 (虚线 处 的 像素 点 个 数 
图 为 150 一 500， 而 图 像 中 每 一 列 的 宇宙 线 像 素 点 个 数 范 围 为 8 一 50) 。 


异常 的 列 来 标注 算法 导致 的 噪点 ， 然 后 将 它们 从 图 像 中 去 除 。 


\， 基 本 会 在 同一 批 拍 摄 
像 来 标识 CCD | 


上 的 坏 像 
像 中 


pS 


会 在 拟 合 图 像 轮廓 时 产生 较 大 的 误差 , 最 终 在 生成 宇 
像 中 呈现 几 列 虚 


利用 这 一 特点 , 在 


宙 线 列表 
线 ， 
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3 凝聚 层次 聚 类 算法 聚 类 宇宙 线 事件 


从 CCD 图 像 中 提取 宇宙 线 像 素 后 ， 采 用 凝聚 层次 聚 类 算法 将 宇宙 线 像素 聚 类 成 一 个 个 
独立 的 宇宙 线 事 件 。 本 文采 用 的 算法 是 在 经 典 的 凝聚 层次 聚 类 算法 上 的 改进 。 

层次 聚 类 试图 在 不 同 层次 对 数据 集 进 行 划分 ,从 而 形成 树 形 的 聚 类 结构 。 数 据 集 的 划分 
可 采用 “ 自 底 向 上 ”的 聚合 策略 ， 也 可 采用 “ 自 顶 向 下 ”的 分 拆 策略 ”。 凝 聚 层次 聚 类 
(AGENS) 是 层次 聚 类 中 的 一 种 ， 它 对 数据 集 的 划分 采用 的 是 “ 自 底 向 上 ”的 聚合 策略 。 
它 的 主要 思路 是 将 数据 集中 的 每 一 个 样本 看 成 单个 的 聚 类 簇 ,然后 计算 每 个 聚 类 艇 之 间 的 距 
离 ， 找 出 其 中 距离 最 近 的 两 个 聚 类 复 将 它们 合并 , 重复 上 述 距 离 计算 和 合并 的 过 程 ， 直至 达 
BPA ERI TL 

在 经 典 的 凝聚 层次 聚 类 算法 中 ， 算 法 的 关键 是 计算 类 间距 的 方法 和 确定 聚 类 艇 的 个 数 。 
每 一 个 聚 类 复 是 一 个 样本 集合 , 可 以 采用 计算 集合 的 某 种 距离 来 计算 类 间距 , 常见 的 距离 有 
最 小 距离 ， 最 大 距离 和 平均 距离 。 将 宇宙 线 像素 聚 类 成 宇宙 线 事件 ， 使 得 宇宙 线 事 件 之 间 相 
互 独 立 ， 采 用 最 小 距离 来 计算 类 间距 。 最 小 距离 计算 公式 见 式 (1) ， 其 中 的 C, C 表 示 给 定 
WRK: mjas... RAR CHIPEAS ERs (mhe... REAR CHIPEAS AR; dist 是 用 于 计算 m, m 
样本 点 的 距离 函数 。 


dyi,(C,,C,)= min dist(m,,m,) (1) 


m, €C; my EC} 


在 处 理 CCD 图 像 时 ， 无 法 预知 图 像 中 宇宙 线 事 件 的 个 数 ， 所 以 无 法 了 预 设 聚 类 复 的 个 数 。 
需要 设 定 类 间距 4 作为 终止 运算 条 件 。 具 体 算法 如 下 : 

(1) 假设 数据 集 为 B，。 数据 集中 的 数据 是 CCD 图 像 中 宇宙 线 所 对 应 的 像素 ， 将 每 个 像 
素 看 作 一 个 初始 的 聚 类 艇 分 别 对 应 于 C, Cy. +s Cro 


D={m,,m,,...,m,} (2) 


(2) 计算 所 有 聚 类 艇 之 间 的 类 间距 ， 式 (3) 采用 欧 氏 距离 和 最 小 距离 来 计算 类 间距 。 
如 果 两 个 聚 类 艇 各 自 上 只 含有 一 个 样本 点 时 ， 类 间距 是 这 两 个 样本 点 的 欧 氏 距离 ;， 反之 ， 类 间 
距 是 两 个 聚 类 篮 之 间 的 最 小 距离 。 如 果 两 个 聚 类 复 的 类 间距 不 大 于 设 定 的 阀 值 ww， 将 这 两 


ee P? 
PERRI HE TRI 0 


d= min VG, —x,) +(y,—ys) 


m,€C; mp, €C ; (3) 


实验 处 理 的 数据 是 二 维 图 像 ， 式 〈3) 中 心 C 表 示 数 据 集中 的 任意 两 个 聚 类 能 ， lita ant sx 
表示 C 的 样本 点 集 ， (mez... 表示 C 的 样本 点 集 ， 丈 和 用 对 应 于 肥 在 图 像 上 的 位 置信 息 ， 辑 
和 六 对 应 于 必 在 图 像 上 的 位 置信 息 。 

(3) 更 新 数据 集 ; 
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宙 线 流量 值 和 背景 值 比较 接近 时 ， 有 时 会 出 现 提 取 的 宇宙 线 像素 在 图 像 中 不 连续 。 
8 现 ， 为 减 小 宇宙 线 像素 的 缺失 带 来 的 误差 ， 结 合 宇宙 线 在 CCD 图 像 中 呈现 随机 
GAA EERE, BORE dhinkd 3 对 提取 后 的 宇宙 线 像素 聚 类 ， 可 以 有 效 地 聚 类 宇 
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据 进行 降 维 处 理 , 目的 是 要 找 


ws 
VY 
lim 
men) 


运算 。 


当 CCD 图 像 中 出 现 大 量 


宇宙 线 事件 时 ， 需 要 逐个 计 
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(3) ， 直 到 数据 集中 所 有 罕 类 簇 的 类 间距 大 于 设 定 的 阔 值 ， 结 


聚 类 簇 之 间 的 距离 ， 使 计算 量 剧 


， 运 行 速率 减 慢 。 结 合 宇宙 线 事件 是 有 计数 的 连续 像素 这 一 特点 ， 通过 判断 与 只 类 簇 最 外 
元 素 距离 为 gz 的 范围 内 是 否 存在 其 他 的 聚 类 禾 ， 来 优化 算法 。 
他 聚 类 艇 与 该 聚 类 艇 合并 ， 如 果 不 存在 ， 将 数据 集中 未 处 理 的 聚 类 艇 重 复 上 述 判断 过 程 ， 


到 所 有 聚 类 复 的 类 间距 大 于 ww， 结束 运 算 。 使 用 该 方法 将 宇宙 线 像素 聚 类 成 宇宙 线 事件 


WAR AEE AR i, FG 


， 如 果 两 个 宇宙 线 事件 的 最 小 距离 大 于 di， 说 明 两 个 宇宙 线 事件 相互 独立 ， 如 果 最 小 距 
离 不 大 于 wm， 说 明 两 个 宇宙 事件 是 同一 个 宇宙 线 事 件 。 在 提取 宇宙 线 像素 的 过 程 中 ， 当 宇 


况 很 少 H 


特征 提取 


将 CCD 图 像 中 的 宇宙 线 像 素 
线 事件 进行 特征 提取 。 在 特征 提取 的 过 程 


聚 类 成 宇宙 线 事件 后 ， 结 合 u 子 在 图 像 中 的 形态 特征 ， 对 宇 
Pp， 主要 内 容 是 主 成 分 分 析 和 Pearson 相 关系 数 。 


尽管 这 种 


宙 线 事件 。 


过 主 成 分 分 析 获 取 宇 宙 线 事件 的 特征 值 ， 以 及 通过 Pearson 相 关系 数 判 断 宇宙 线 事件 是 否 
线性 ， 来 甄选 宇宙 线 事 件 中 的 上 子 。 


1 主 成 分 分 析 (PCA) 


主 成 分 分 析 (PCA) ， 也 称 为 Karhunen-Loeve 扩 展 ， 是 一 种 经 典 的 特征 提取 和 数据 表示 
技术 I'M"。 参 考 文献 [11] 对 主 成 分 分 析 进 行 了 总 的 概括 。 主 成 分 分 析 PCA) 也 可 以 用 于 对 数 


组 最 优 的 标准 正 交 问 量 基 , 使 得 数据 投影 到 这 组 最 优 标准 正 


交 向 量 基 上 的 方差 最 大 。 宇 宙 线 事件 是 二 维 数据 ， 假 设 在 一 个 宇 


定义 样本 集 的 散 度 矩 阵 为 gr: 


其 中 样本 集 均值 : 


假设 从 高 维 空间 投影 到 低 维 空间 的 投影 矩阵 为 四 HE BOY Ja 


1 n 

来 

EE 
N i=l 


宙 线 事件 中 含有 7 个 像素 ， 
SUPEASSEME (m, me... th) 将 所 有 样本 进行 中 心 化 ， 如 式 (4) 。 


(4) 


(5) 


(6) 


本 点 方差 最 大 化 的 优化 目 


标 为 : 
Swan (7) 


对 5S 做 特征 值 分 解 得 到 特征 值 4， 将 特征 值 4 进行 降序 排序 ， 选 取 最 大 的 特征 值 。 最 大 
的 特征 值 所 对 应 的 特征 向 量 就 是 主 成 分 的 解 ， 从 而 找到 最 优 的 标准 正 交 向 量 基 , 得 到 宇宙 线 
事件 的 特征 向 量 。 将 宇宙 线 事件 在 特征 向 量 方向 上 的 投影 作为 宇宙 线 事 件 的 特征 。 两 个 特征 
向 量 对 应 于 两 个 特征 值 。 其 中 一 个 特征 值 对 应 于 宇宙 线 的 长 轴 ， 即 在 CCD 上 宇宙 线 直线 径 迹 
所 对 应 的 轴 ; 另 一 个 特征 值 对 应 于 宇宙 线 的 短 轴 ， 即 宇宙 线 在 CCD 图 像 上 的 宽度 。un 子 在 CCD 
图 像 的 径 迹 是 直线 型 ， 且 径 迹 长 度 无 法 确定 , 但 宽度 有 限 ， 是 个 小 量 。 选 取 标记 宽度 的 特征 
作为 子 的 特征 ， 并 将 其 记 为 “投影 宽度 
4. 2 Pearson 相 关系 数 

相关 系数 是 用 来 衡量 变量 之 间 线 性 相关 程度 的 统计 量 。 用 于 定义 相关 系数 的 方式 有 很 
多 ， 最 为 常用 的 是 Pearson 相 关系 数 。Pearson 相 关系 数 用 于 描述 两 个 变量 之 间 是 否 存在 线性 
关系 。 参 考 文献 [12] 对 Pearson 相 关系 数 进行 了 详细 介绍 。 假 设 有 两 个 变量 分 别 是 x 和 它们 
的 Pearson 相 关系 数 用 7 表示 ， 则 有 : 


EPRA o 分 别 对 应 于 变量 x，y 的 均值 。: 的 取 值 范 围 为 [-1, 1]，|7| 越 接近 于 1 时 ， 两 个 
变量 之 间 的 线性 相关 性 质 越 显 著 。 当 让 0 时 ， 两 个 变量 之 间 呈 正 相 关 ;， 当 xX0 时 ， 两 个 变量 
之 间 呈 负 相 关 : r0 时 ， 两 个 变量 之 间 彼 此 独立 。 

宇宙 线 n 子 在 CCD 上 呈 直 线 轨迹 ， 则 h 子 在 CCD 图 像 中 的 横 纵 坐标 存在 线性 关系 。 利 用 
Pearson 相 关系 数 来 标记 h 子 的 这 一 特征 。 由 于 h 子 在 图 像 中 的 位 置 有 时 会 出 现 正 相关 ， 有 时 
会 出 现 负 相关 ， 为 了 显示 线性 相关 性 质 的 显著 程度 ， 在 传统 的 Pearson 相 关系 数 的 基础 上 取 
绝对 值 。 下 文 提 到 的 Pearson 相 关系 数 r 对 应 取 绝 对 值 的 Pearson 相 关系 数 。 


5 实验 结果 及 分 析 


利用 宇宙 线 h 子 与 其 他 粒子 在 CCD 图 像 中 的 形态 特征 差异 来 甄选 n 子 。 在 CCD 图 像 中 最 
为 常见 的 粒子 是 un 子 和 “worms”(“worms” 是 多 级 散射 的 电子 , 详细 介绍 见 参考 文献 [2] )。 
o 粒 子 在 CCD 图 像 上 极 少 出 现 。CCD 图 像 中 还 存在 一 些 形状 奇特 的 宇宙 线 事 件 ， 因 无 法 确定 
其 形态 特征 ， 难 以 判断 属于 何 种 宇宙 线 粒 子 ， 在 下 文中 未 做 讨论 。 图 2 是 从 LAMOST 数 据 
中 获得 的 图 像 ， 图 2(a) 是 宇宙 线 中 的 hn 子 ， 图 2(p) 是 宇宙 线 中 的 “worm”。 如 图 2(b) 所 示 ， 
“worm” 形 状 呈 现 一 定 的 弧度 。 
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图 2 LAMOST CCD 图 像 的 上 子 和 “worm” 


Fig.2 cosmic-rays muon and “worm” in the CCD image of LAMOST 
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利用 文中 章节 1 至 章节 3 的 处 理 过 程 , 我 们 从 2015 年 的 LAMOST CCD 图 像 中 随机 选取 


了 200 多 张 CCD 图 像 ， 得 到 3 万 多 个 宇宙 线 事件 ， 将 选取 的 宇宙 线 事件 的 位 置 索 引信 息 
宙 线 事件 的 位 置 索引 信息 可 以 反映 出 宇宙 线 事 件 在 CCD 图 像 上 呈现 的 形态 。 


为 样本 集 C71。 宇 
从 样本 集中 通过 人 了 眼 识别 的 方式 ， 选 取 1000 个 n 子 和 1000 个 “worms” 作 为 数据 样本 1。 


作 


统 


计 这 些 宇宙 线 事件 的 “投影 宽度 ”和 Pearson 相 关系 数 ， 结 果 见 表 1。 表 1 中 宇宙 线 事 件 “ 投 
影 宽 度 ” 的 均值 记 为 1w,， 标 准 差 记 为 ow,; Pearson AR RAEE W Nuo PEWNO 


表 1 关于 “投影 宽度 ”和 Pearson 相 关系 数 ， 宇 宙 线 nu 子 、“worms” 的 特征 对 比 


Tab.1 Feature comparison between muons and “worms” in cosmic rays of the “Projection 


width” and the Pearson correlation coefficient 
Type of cosmic rays “The projection width” (Hupt0wp) Pearson correlation coefficient(,+0,) 
muons 1.43+0.50 0.93+0.06 
“worms” 5.10+2.03 0.73+0.15 


根据 表 1 TEMA Pl PA “worms” AIDC GI. 在 “投影 宽度 ”中 , p 子 的 特征 值 小 ， 


“worms” 的 特征 值 大 ;在 Pearson 相 关系 数 中 ， 由 于 h 子 在 CCD 中 时 直线 径 迹 ， 对 应 的 横 


纵 坐 标的 线性 相关 程度 更 显著 ， 对 应 的 Pearson 相 关系 数值 更 接近 1， 而 “worms” 由 于 在 


CCD 中 发 生 多 次 散射 ， 径 迹 有 一 定 的 弧度 ， 对 应 的 Pearson 相 关系 数值 较 h 子 的 更 小 。 


从 样本 集 C7 中 ， 通 过 人 眼 识别 的 方式 ， 随 机 选取 2500 个 nu 子 和 2500 个 不 是 hn 子 的 其 他 


宇宙 线 事 件 (包含 “worms”、X 射 线 、 可 能 的 a 粒子 等 其 他 粒子 〉 作 为 数据 样本 2。 这 5000 
个 宇宙 线 事 件 的 “投影 宽度 "和 Pearson 相 关系 数 的 分 布 结果 如 图 3(a) 所 示 。 在 图 3(a) 中 ， 利 
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用 “投影 宽度 "和 Pearson 相 关系 数 两 个 特征 可 以 将 绝 大 多 数 的 hn 子 和 其 他 宇宙 线 区 分 开 。 在 
图 中 Pearson 相 关系 数 大 于 0.8 和 “投影 宽度 ”小 于 1 的 范围 内 , 4 子 和 其 他 宇宙 线 事件 不 能 
很 好 的 区 分 ， 观 测 这 部 分 与 4 子 特征 值 相近 的 宇宙 线 事 件 ， 发 现 该 部 分 宇宙 线 事件 的 像素 个 
数 很 少 。 分 析 Pearson 相 关系 数 和 宇宙 线 事件 像素 个 数 的 关联 ， 二 者 的 分 布 结 果 见 图 3(b)。 
图 3(a) 中 不 易 区 分 的 n 子 和 其 他 宇宙 线 事件 ， 在 图 3(b) 中 可 以 通过 宇宙 线 事件 的 像素 个 数 有 
效 地 区 分 。 
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图 3 不 同 特征 值 的 分 布 结 果 


Fig.3 The distribution of different characteristic values 


对 于 像素 个 数 少 的 宇宙 线 事件 ， 只 结合 “投影 宽度 "和 Pearson 相 关系 数 甄选 A 子 会 有 一 
定 的 误差。 当 甄选 kb 子 时 ， 还 需要 结合 宇宙 线 事 件 的 像素 个 数 。 图 4 显示 了 数据 样本 2 中 宇 
宙 线 事件 像素 个 数 的 统计 结果 。 横 坐 标 表示 宇宙 线 事 件 的 像素 点 个 数 , 纵 坐 标 表示 像素 点 个 
数 对 应 的 宇宙 线 事件 的 个 数 。 图 4(a) 是 整个 数据 集 的 统计 结果 。 图 中 宇宙 线 事 件 的 像素 点 个 
数 越 多 ， 与 之 对 应 的 宇宙 线 事件 个 数 越 少 。 基 于 图 4(a)， 选 取 像 素 点 个 数 不 大 于 30 的 宇宙 
线 事件 进行 统计 ， 结 果 见 图 4b)。 图 中 ， 宇 宙 线 h 子 的 像素 点 个 数 大 于 8， 其 他 宇宙 线 事 件 
的 像素 点 个 数 大 于 5。 在 非 h 子 的 其 他 宇宙 线 中 ,将 近 一 半 的 宇宙 线 的 像素 点 个 数 小 于 8。 在 
像素 点 个 数 大 于 8 的 情况 下 ，U& 子 的 个 数 比 其 他 宇宙 线 的 个 数 多 。 因 此 将 像素 点 个 数 设置 为 
8， 对 宇宙 线 中 hk 子 和 其 他 宇宙 线 事件 进行 分 类 。 
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图 4 宇宙 线 事件 的 像素 点 个 数 的 统计 结果 


Fig.4 The statistical result of the number of pixels in cosmic-ray event 


根据 宇宙 线 事件 特征 值 的 不 同 分 布 ， 设 定 不 同 的 特征 值 参数 ， 对 上 子 进行 甄选 。 从 样本 
RCIP, KEPLER 2500 个 上 FA 2500 个 不 是 上 子 的 宇宙 线 在 CCD 上 的 位 置 索引 信息 作为 
测试 数据 集 C2， 设 定 不 同 的 特征 值 参数 对 宇宙 线 中 的 hn 子 进行 甄选 ， 最 后 的 甄选 结果 如 表 2 
所 示 。 表 2 显示 了 甄选 结果 的 准确 性 ， 表 中 的 第 一 列 是 特征 参数 的 设 定 ， 其 中 的 pm 对 应 于 
子 “ 投 影 宽度 ”的 均值 ， cnw 对 应 于 n 子 “投影 宽度 ”的 标准 差 ， 对 应 于 un 子 Pearson 相 关系 
数 的 均值 ， ow 对 应 于 un 子 Pearson 相 关系 数 的 标准 差 ; 第 二 列 是 正确 甄选 宇宙 线 中 h 子 的 个 数 ; 
第 三 列 是 被 错 分 成 nb 子 的 宇宙 线 事件 个 数 ; 第 四 列 是 甄选 结果 的 正确 性 ， 最 后 一 列 是 甄选 结 
果 的 灵敏 度 ， 用 于 衡量 算法 对 n 子 的 识别 能 力 。 假 设 在 整个 数据 集中 ，u 子 的 个 数 是 M， 非 H 
子 的 宇宙 线 事件 个 数 为 F。 在 王选 结果 中 , 被 正确 王选 为 hn 子 的 宇宙 线 事件 个 数 为 TM, 被 正确 
于 选 为 非 u 子 的 宇宙 线 事件 个 数 为 TTF， 则 于 选 结果 的 准确 率 公式 见 式 (9) ， 甄 选 结果 的 灵敏 
度 公式 见 式 (10)。 


A COC ERA Fe (9) 
LE 


(10) 


AK 2 可 以 看 出 : 当 对 “投影 宽度 ”、Pearson 相 关系 数 和 宇宙 线 事件 的 像素 个 数 设 定 
不 同 阔 值 时 ,会 得 到 不 同 的 准确 率 ; 当 特 征 值 设 定 合适 的 阔 值 时 ， 可 以 有 效 地 从 宇宙 线 事件 
Py K 2 特征 参数 的 选择 ， 需 要 结合 表 1 中 p 子 不 同 特征 的 均值 和 标准 差 。 通 过 统 
计 宇 宙 线 p 子 的 “投影 宽度 ”和 Pearson 相 关系 数 ， 得 到 描述 不 同 特征 的 具体 数值 参数 以 及 参 
数 的 波动 情况 。 结 合 不 同 特征 的 参数 波动 ， 对 测试 数据 集中 的 h 子 进行 甄选 ， 得 到 最 终 的 对 
选 结果 。 


He 2 设 定 不 同 # 
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Tab.2 The results of cosmic-ray muons selection when setting different feature parameters 


Condition about “Projection width’’(pw) , Pearson 


Numbers of muons Numbers of muons 
correlation coefficient(r) and the number of cosmic Accuracy Sensitive 
detected correctly detected incorrectly 
event(pixel) 
(CF È Ln 36 mr and O< PWK Lony+Gmy) OF 
2412 88 0.965 0.965 
(F > Umr and pw 天 0)) and pixel>=8 
(CF È Umr 36mr and O< PWK fony+2Gmy) OF 
2500 108 0.978 1 
(F > Jun and pw40)) and pixel>=8 
(Cr = Ln 36 mr and O< PWK fony+3 Gin) OF 
2500 117 0.977 1 


(r= Umr and pw% 0)) and pixel>=8 


HITE H EF IE DC E LY 


SEITE BAA 0.98, TNA ATI Ay WA e Eh 


选 宇宙 线 中 的 上 子 。 该 方法 对 王子 的 识别 度 很 高 ， 但 是 会 将 与 上 子 特征 相似 、 不 是 上 子 的 宇 


宙 线 事件 错 分 成 hb 子 。 
尽管 该 算法 在 数据 处 理 过 程 中 会 存 


me 


在 误差 .但 是 通过 分 析 h 子 的 本 征 特征 ， 结 合 数据 集 


中 h 子 和 其 他 宇宙 线 事 件 的 形态 差异 ， 依 然 可 以 有 效 地 甄选 宇宙 线 中 的 np 子 。 该 方法 的 核心 


是 特征 参数 的 设 定 。 如 果 特 征 值 的 参数 设 定 恰当 ， 最 后 的 甄选 结果 会 更 可 观 ， 也 可 以 通过 训 


练 大 量 数据 集 的 方式 来 调整 特征 参数 ,优化 方法 。 根据 表 2 中 最 优 的 甄选 条 件 GR 2 中 第 二 
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图 52017 年 11 月 份 LAMOST 6r CCD 图 像 中 宇宙 线 上 子 个 数 的 统计 结果 


Fig.5 The statistical result of the numbers of cosmic-ray muons in 6r CCD of LAMOST in November 2017 
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Cosmic-ray Muons Extraction Technology in CCD Image 
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Abstract: The cosmic rays in CCD(Charge Coupled Device) image are formed by 
high-energy particles from outer space which pass through the atmosphere, collide with particles 
in the atmosphere and fall on the CCD panel finally. The cosmic-ray muons are the main 
component of cosmic rays in the atmosphere. In order to study cosmic-ray muons’ property and 
change rule, we need extract cosmic-ray muons in CCD images. This paper introduces an easy and 
effective method to extract cosmic-ray muons in CCD images. The main work includes the 
following steps: searching the cosmic rays candidate lists from CCD images by the Laplacian edge 
detection algorithm; removing bad pixels and noise from the extracted cosmic rays candidate lists; 
clustering cosmic rays pixels into cosmic ray events by AGglomerative NESting method; then 
extracting cosmic-ray muons according to the extracted features. Finally, the result of extracting 
cosmic-ray muons is summarized and analyzed. 

Key words: CCD; Cosmic-ray muons; Laplacian edge detection algorithm; AGglomerative 


NESting; Feature extracting 
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